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(57) Abstract: The invention concerns a method for reconfiguring an array of parallel functional elements fault-tolerant towards 
said functional elements comprising said basic functional elements (P), additional functional elements (Sp), elements interconnecting 
(Cm) said functional elements and a control unit, said method consisting in: a step for placing the functional elements of the logic 
network on the physical network; a routing step which consists in programming the interconnecting elements on the physical network, 
selecting a maximum number of interconnecting elements capable of being run through by two neighbouring processors using a 
shortest path algorithm. 
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PROCEDE DE RECONFIGURATION APPLICABLE A UN RESEAU 
D ' ELEMENTS FONCTIONNELS IDENTIQUES 

DESCRIPTION 

5 

Domaine technique 

La presente invention concerne un procede de 
reconfiguration applicable a un reseau d' Elements 
f onctionnels identigues . 

10 Le domaine de 1 ' invention est notamment celui 

des calculateurs paralleles formant un ensemble de 
processeurs interconnects, en matrice, en anneau bu en 
hypercube, et celui des correlateurs ID ou 2D, des 
architectures de matrice de bloc de calculs de la 

15 transform^ de Fourier rapide (FFT) . Deux exemples du 
premier type d' applications sont ainsi donnes dans le 
, ' document r6ferenc<§ [1] en fin de description. 

Etat de la technique anterieure 

20 Les possibility croissantes de la technologie 

micro-electronique, de m£me que 1' evolution des 
architectures multiprocesseurs, conduisent a des 
calculateurs de plus en plus complexes tant en termes 
d' elements qui les composent (portes 61ectroniques , 

25 memoires, registres, . processeurs. . . ) , qu'en termes de 
complexite des logiciels utilises. 

Les concepteurs de tels calculateurs a 
structure parallele ou massivement parallele tres 
int6gree doivent prendre en compte deux exigences 

30 antagonistes : 

1« D es machines a structure parallele ou 
massivement parallele sont sujettes a des defauts dus 
au nombre tres important de processeurs et a la 
complexity de ceux-ci, ce qui induit un mauvais 
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rendement de fabrication et des fautes graves en 
fonctionnement normal. 

2- Avec des technologies tres avancees et des 
systemes tres int^gres, de plus en plus de processeurs 
5 peuvent etre incorpores dans un circuit integr6 
specif ique (en anglais ASIC ou « Application Specific 
Integrated Circuit ») , un module multipuce (en anglais 
MCM ou « Multichip Module ») ou une carte. Dans de tels 
systemes le principal inconvenient est celui d'une 

10 bande passante, . c'est-a-dire une quantite 

d ' informations que .1 ' on peut passer, limitee. 

Pour repondre a la premiere de ces exigences, 
une solution de l'art connu consiste a remplacer les 
processeurs fautifs par des processeurs supplementaires 

15 identiques aux autres du point de vue f onctionnel . Une 
telle solution, permettant une « tolerance aux fautes 
structurelle » , s ' ef force alors a garantir le bon 
fonctionnement, et notamment la coherence du r^seau, 
pour ne pas penaliser 1 ' architecture . Elle implique une 

2 0 reconfiguration consistant dans le remplacement 
d' Elements fautifs par des elements supplementaires 
disponibles grice. a des elements d ' interconnexion et a 
des elements d' intercommunication. 

Dans un reseau de type 2D (ou en deux 

25 dimensions) , les solutions propos^es pour assurer la 
tolerance aux fautes consistent : 

• A a j outer au systeme autant de lignes de 
processeurs qu'on yeut tolerer de fautes. Cette 
solution est tres simple et necessite peu 

30 d' interconnexions supplementaires, la reconfiguration 
s'effectuant par une simple derivation (en anglais 
« Bypass ») des lignes ou un processeur est fautif. Les 
pertes en performance sont alors limitees. Par contre, 
1 ' utilisation des processeurs supplementaires est tres 

35 mauvaise puisqu'il faut une ligne pour tolerer une 
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faute, et qu'en cas de faute d'une derivation le 
systeme complet est' mis en d6faut. 

• Ou, a a j outer des commutateurs , des 
processeurs supplementaires , et des connexions au 
5 reseau normal . 

Comme decrit dans le document reference [2] , un 
reseau correspondant a ce second type de solution et 
appel£ « m-Track, n-Spare » (ou « m chemins , n 
10 supplementaires ») se compose de processeurs 10, de 
commutateurs et de connexions supplementaires. Deux 
sortes de commutateurs sont utilises : les commutateurs 

11 reliant les processeurs aux connexions (PT pour 
« Processor to Track ») et les commutateurs 12 reliant 

15 les connexions entre elles (TT pour « Track-to- 
Track ») . Toutes les liaisons du reseau sont 
bidirectionnelles , c'est-a-dire que les communications 
peuvent aller dans les deux sens dans chaque connexion. 
Des processeurs supplementaires 13 (sp) sont 

20 positionnes aux fronti^res du reseau. Ces processeurs, 
pour que la methode de reconfiguration soit efficace, 
doivent etre places au moins sur une ligne et une 
colonne du reseau. 

La figure 1 illustre un exemple de reseau de 

25 type « 2-Track, 1-Spare ». Des processeurs 

supplementaires 13 (sp) sont places tout autour du 
reseau et servent a reconfigurer le reseau en cas de 
faute des processeurs utiles 10. Des commutateurs 11, 

12 sont utilises pour permettre la reconfiguration. Le 
3 0 reseau comprend ici 200 % de connexions supplementaires 

par rapport aux connexions dites f onctionnelles . 

L'homme de metier peut alors utiliser une 
methode de reconfiguration, basee sur des codes 
correcteurs d'erreur, se d^composant en deux phases : 
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- la premiere consiste, pour chaque processeur 
fautif, a trouver un chemin de compensation qui 
contourne le processeur fautif et le remplace par un 
processeur supplementaire ; 

5 - en cas de reussite de la premiere phase, 

chaque processeur est, le long du chemin de 
compensation, remplace par son plus proche voisin, en 
allant ainsi, par des changements en cascade, jusqu'a 
un processeur supplementaire. La grille f onctionnelle 
10 est ainsi conserv^e. 

La m^thode . de reconfiguration consideree ci- 
dessus possede deux desavantages majeurs : 

- elle n'est pas adapt£e au cas des liaisons 
monodirectionnelles ; dans ce cas en effet, deux bus de 

15 connexion, un aller et un retour, sont necessaires pour 
connecter le processeur consid^re a chacun de ses 
yoisins. 

- le nombre d'61£ments de commutation traverses 
entre deux processeurs voisins logiquement n'est pas 

2 0 d^terministe, ce qui rend la m^thode inefficace pour 

traiter le cas des communications synchrones entre 
processeurs . 

Pour resoudre ces inconvenients , le procede de 
25 1' invention a pour objectif de resoudre le probleme de 
la tolerance aux fautes dans une architecture 
massivement parallele ou les elements fonctionnels sont 
tres fortement couples, en proposant une solution 
repondant aux contraintes suivantes : 

3 0 - obtenir un reseau tolerant aux fautes avec 

des connexions pouvant etre monodirectionnelles ; 

- limiter fortement les supports de 
communication non fonctionnels du reseau ; 

- limiter le temps de communication entre 
35 elements fonctionnels en limitant le nombre de 
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commutateurs de reconfiguration traverses entre deux 
elements f onctionnels ; 

- autoriser une plus grande souplesse dans le 
choix du nombre d' elements f onctionnels 

5 supplementaires ; 

- disposer d'une solution capable de supporter 
des topologies differentes, notamment en matrice, en 
anneau, ou en hypercube. 

10 Expose de 1 ' invention 

La presente invention concerne un procede de 
reconfiguration d'un reseau d' elements f onctionnels 
identiques paralleled avec tolerance aux fautes de ces 
elements f onctionnels , le reseau comportant lesdits 

15 elements f onctionnels de base, des elements 
f onctionnels supplementaires, des Elements 

d' interconnexion de ces elements f onctionnels et une 
unite de controle, ledit proced<§ comprenant : 

- une etape de placement des elements 
20 fonctionnels du reseau logique ; 

- une etape de routage consistant en urie 
programmation des elements d ' interconnexion sur le 
reseau physique en choisissant le nombre maximal de ces 
elements d' interconnexion pouvant etre traverses entre 

25 deux elements fonctionnels voisins utilisant un 
algorithme de recherche du plus court chemin. 
Dans ce procede de 1' invention : 

- on determine un ordre de placement des 
elements fonctionnels du reseau qui est constitue d'un 

30 element fonctionnel d'origine et d'une suite d' elements 
fonctionnels englobant tous les elements fonctionnels ; 

- pour chacun des elements fonctionnels on 
essaie de le placer en commengant par sa place logique 
puis, si necessaire en cas d'£chec, en chacune des 

35 places situees a une distance 1, a une distance 2... de 
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la place logique de cet element fonctionnel, avec comme 
restriction qu'une'et une seule place supplementaire 
doit etre utilisee par rapport aux places possibles des 
elements fonctionnels prec^demment places, en arr§tant 
5 lorsgue S+l places ont 6te essay^es, S £tant le nombre 
d' Elements fonctionnels supplementaires ; 

- si S+l places ont ete essay^es sans succes, 
on revient a 1' Element fonctionnel precedent dans 
1 ' ordre de placement et on passe a la place suivante 

10 pour cet element fonctionnel ; 

- eventuellement lorsque tous les elements 
fonctionnels sont places, on verifie pour chaque 
dimension du rdseau que 1 ' ordre logique est respecte 
pour chaque couple d' elements fonctionnels, si ce n'est 

15 pas le cas on inverse les places de ces 616ments 
fonctionnels. 

Dans un mode de realisation, 1 ' ordre de 
placement est defini ainsi : 1 ' element fonctionnel 
d'origine est 1' element fonctionnel en haut a gauche, 

2 0 les elements fonctionnels suivants sont les elements 

fonctionnels a droite et en bas de 1' element 
fonctionnel d'origine, et ainsi de suite en respectant 
la diagonale. 

On peut egalement decouper le reseau en blocs 
25 et definir un ordre de placement des blocs en partant 
d'un bloc d'origine et en parcourant tous les blocs de 
bloc voisin en bloc voisin, les places pour les 
elements fonctionnels d'un bloc ne comportant pas de 
place logique des elements fonctionnels des blocs 

3 0 places pr6c6demment . 

Avantageusement ce procede de 1' invention peut 
etre mis en oeuvre soit de maniere statique, soit de 
maniere dynamique en cours de f onctionnement . 

II paralt important de preciser les deux points 
3 5 suivants : 
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• Le procede de 1' invention permet d'inclure 
facilement des poss'ibilites de tolerance aux fautes au 
niveau des interconnexions et des elements 
d ' interconnexion . 
5 • Le procede de 1' invention est a contre-pied 

des proced^s antecedents dans le sens ou les 
caract^ristiques du r^seau que sont le nombre de liens 
supplementaires et 1 ' organisation des Elements 
d' interconnexions ne sont pas imposes par le procede, 
10 ce qui permet une plus grande souplesse dans le choix 
de 1 ' architecture tolerante aux fautes. 

Breve description des dessins 

La figure 1 illustre un reseau de processeurs 
15 de T art connu . 

Les figures 2A et 2B illustrent un exemple de 
reseau obtenu par le procede de 1' invention. 

La figure 3 illustre la notion de* distance dans 
le reseau illustre sur la figure 2B. 
2 0 La figure 4 illustre un organigramme du procede 

de 1 ' invention . 

Les figures 5A et 5B illustrent un exemple de 
non coherence du procede de 1' invention apres le 
placement des elements f onctionnels . 
25 Les figures 6A, 6B et 6C illustrent un exemple 

d'algorithme de placement deduit directement du procede 
de 1' invention. 

La figure 7 illustre un algorithme par bloc 
deduit du procede de 1' invention. 
30 Les figures 8A et 8B illustrent des exemples de 

reconfiguration d'un reseau d'elements fonctionnels 
dans une topologie de matrice. 

La figure 9 illustre la composition d'un reseau 
de processeurs obtenu par le proced6 de 1' invention. 
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La figure 10 illustre les entrees et sorties 
d'un element d ' interconnexion interne au reseau de la 
figure 9. 

Les figures 11A a 11H illustrent les entrees et 
5 sorties des Elements d ' interconnexion aux frontieres du 
reseau de la figure 9 . 

La figure 12 illustre le reseau de la figure 9, 
avec les liaisons entre processeurs et elements 
d ' interconnexion . 
10 Les figures 13A a 13C illustrent les 

communications minimales dans le reseau de la figure 9. 

Les figures 14A et 14B illustrent la 
realisation pratique d'un element d ' interconnexion 
interne au reseau de la figure 9 a partir d'un 
15 multiplexeur 6 vers 1. 

La figure 15 illustre un exemple de mise en 
oeuvredu reseau de la figure 9. 

Les figures 16 a 19 illustre plusieurs exemples 
de reseau de processeurs de type hypercube, a savoir un 
20 hypercube de dimension 3 sur la figure 16, un hypercube 
de structure reguliere virtuelle avec quatre 
processeurs supplementaires sur la figure 17, un 
exemple de reconfiguration d' hypercube comprenant trois 
processeurs fautifs deduits du procede de 1' invention 
25 sur la figure 18, et un hypercube de dimension 4 
comprenant une ligne de processeurs supplementaires sur 
la figure 19 . 

La figure 20 illustre 1 ' architecture d'un 
correlateur 2D. 

3 0 La figure 21 illustre un exemple d' utilisation 

du procede de 1' invention dans la structure matricielle 
de 1 ' architecture illustree sur la figure 20. 
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Expose detains de modes de realisation 

La presente invention concerne un proc6de de 
reconfiguration d'un reseau d' elements fonctionnels 
identiques . 

5 

Procede de reconfiguration 

Dans la structure « m-Track, n-Spare » de 1 ' art 
connu, illustr^e sur la figure 1, le proced^ de 
reconfiguration consiste a rechercher un chemin appele 

10 « chemin de compensation » pour remplacer un element 
fonctionnel . el^mentaire fautif par un Element 
fonctionnel supplementaire . Ensuite en partant de cet 
Element fonctionnel elementaire fautif, chaque 616ment 
fonctionnel est remplace par 1' element fonctionnel 

15 suivant disponible, le plus proche sur le . chemin. Mais 
ce precede n' est vraiment efficace que lorsque des 
Elements fonctionnels supplementaires existent dans au 
moins une ligne et une colonne, ce qui n'est pas 
possible avec une ligne d' elements fonctionnels 

2 0 supplementaires et deux chemins monodirectionnels . De 
plus un tel proc^de ne permet pas de reduire le nombre 
de commutateurs dans les chemins de communication. 

Par contre le proc£d6 de reconfiguration de 
1' invention est base sur une technique de placement 

25 d^correlee du routage. 

Le placement consiste en un placement physique 
d' Elements fonctionnels voisins logiques. La place 
logique d'un element fonctionnel est la place que cet 
element fonctionnel occupe dans le reseau sans element 

30 fonctionnel fautif ; la place physique d'un element" 
fonctionnel est la place occupee par cet element 
fonctionnel apres application du proc6d£ lorsqu'une 
faute a ete d^tectee. Le placement est sur d'aboutir a 
condition que le nombre d' elements fonctionnels fautif s 
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soit inf^rieur ou 6gal au nombre d' elements 
fonctionnels supplementaires . 

Le routage consiste en une programmation des 
Elements d' interconnexion . Le nombre de commutateurs 
5 qui peut etre traverse entre deux elements fonctionnels 
voisins est choisi. Ce nombre est limits : trois ou 
quatre commutateurs conduisent a un bon rendement de 
reconfiguration. L' algorithme de , routage peut ainsi 
essayer le plus grand nombre de possibilites de routage 

10 dans un temps tres court avec un algorithme approprie. 

Dans les systemes de l'art ant^rieur, la 
programmation des elements de commutation est assuree 
des lors qu'une place de remplacement est trouvee pour 
chaque element fonctionnel fautif en suivant un 

15 algorithme precis. Les algorithmes de placement des 
616ments fonctionnels sur la grille physique et de 
routage des Elements de commutation sont 
indissociables . 

Dans le proced6 de 1' invention, seul le 

20 placement des elements fonctionnels est original. Le 
routage des elements d' interconnexion est effectue par 
un algorithme de recherche du plus court chemin connu 
de 1'homme de metier, cet algorithme 6tant utilisable 
dans 1' invention grace aux restrictions faites sur la 

25 longueur des chemins et, notamment, sur le nombre 
d' elements d' interconnexions traverses . 

• Etape de placement 

Sur les figures 2 et 3 est illustr4 

30 schematiquement un reseau d' elements fonctionnels 
elementaires identiques 30, chaque element fonctionnel 
de base etant logiquement connecte avec un nombre 
identique d' elements fonctionnels voisins du meme 
reseau, a 1 # exception des elements fonctionnels situes 

35 sur les bords du reseau, et d' elements fonctionnels 
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supplementaires 31 prevus chacun pour remplacer un des 
elements fonctionnels elementaires 3 0 en cas de faute 
de celui-ci. 

La figure 2A illustre un element fonctionnel du 
5 reseau avec ses quatre voisins logiques . La figure 2B 
illustre un exemple de reseau, les elements 
fonctionnels supplementaires 31 etant indiques en 
grise, les liaisons 32 6tant les liaisons logiques. 

La figure 3 illustre la notion de distance 
10 entre deux elements fonctionnels : celle-ci est le 
nombre minimum de connexions necessaires pour aller 
d'un element fonctionnel a un autre. Les deux elements 
fonctionnels 3 5 cercles de noir sont a une distance de 
cinq l'un de 1' autre, deux Elements fonctionnels 
15 voisins 6tant a une distance unit£. 

Le proc6d6 de 1' invention a pour objet de 
placer les elements fonctionnels dans le reseau, . de 
maniere a minimiser la somme des distances entre tous 
les elements fonctionnels voisins. Ce proc^de presente 
20 les caracteristiques suivantes : 

• Critere 1 : pour choisir les places des 
elements fonctionnels afin d' assurer une distance 
minimale entre Elements fonctionnels voisins, on 
effectue un placement autour de la position de 

25 1' element fonctionnel d'origine en utilisant les 
elements fonctionnels a une distance 0 puis 1, puis 2, 
puis 3 . . . de la place loglque de cet element 
fonctionnel . 

• Critere 2 : pour s' assurer qu'un placement 
3 0 est possible pour tous les elements fonctionnels du 

reseau, quel que soit le nombre d' elements fonctionnels 
fautifs ou non valides, on d<§finit tout d'abord un 
ordre de placement des elements fonctionnels qui est 
constitue d'un element fonctionnel d'origine et d'une 
35 suite d' elements fonctionnels englobant tous les 
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elements f onctionnels . Chague element fonctionnel 
nouveau est choisi parmi les elements f onctionnels 
voisins, logiquement des Elements f onctionnels 
precedents. Puis, en suivant cet ordre allant de 
5 1' element fonctionnel d'origine au dernier Element 
fonctionnel, on definit S+l places possibles, S etant 
le nombre d' elements f onctionnels supplementaires , et 
1 ' ordre des places de chaque element fonctionnel, avec 
comme restriction qu'une et une seule place 
10 supplement aire doit §tre utilisee par rapport aux 
places possibles des elements fonctionnels pr^cedemment 
places . 

• Critere 3 : pour assurer la coherence globale 
du reseau, on met even tue 1 1 ement en place en fin' de 

15 placement un mecanisme de: respect de la coherence qui 
consiste en une detection des inversions logiques de 
chaque couple des elements fonctionnels voisins 
logiquement dans chaque dimension et en une inversion 
des places des deux elements fonctionnels lorsqu'une 

20 telle inversion est detect^e. 

Pour remplir ces differents criteres, le 
procede de 1' invention comprend les etapes suivantes : 

- on determine un ordre de placement des 
25 elements fonctionnels comme d^fini ci-dessus au critere 

2 ; 

- pour chacun des elements fonctionnels, on 
essaie de le placer en commengant par sa place logique, 
puis si n^cessaire en cas d'echec (element fonctionnel 

3 0 fautif ou place occupee par un autre element 
fonctionnel) en chacune des places situees a une 
distance 1, a une distance 2 etc., tout en respectant 
la loi enoncee dans le critere 2 : c'est-a-dire qu'une 
et une seule place supplementaire doit etre utilisee 

35 par rapport aux places possibles des elements 
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fonctionnels prec6demment places. Si la place ne 
respecte pas cette loi, on essaie une autre place, qui 
peut §tre a une distance plus grande si necessaire. On 
arrete lorsque S+l places ont 6te essayees ; 
5 - si S+l places ont 6te essayees sans succes, 

on remonte a l'£l(§ment fonctionnel precedent dans 
l'ordre de placement et on passe a la place suivante 
pour cet element fonctionnel ; 

- lorsque les Elements fonctionnels sont tous 
10 places, on verifie pour chaque dimension du systeme, 
. par exemple en ligne et en colonne pour un tableau 
d' elements fonctionnels, que l'ordre logique est 
respects pour chaque couple d' elements fonctionnels. Si 
ce n'est pas le cas, on inverse les places de ces 
15 elements fonctionnels. 

L ' organigramme illustr6 sur la figure 4 resume 
les trois dernieres etapes de ce procede. 

Les figures 5A et 5B illustrent un exemple de 
non coherence dans le r£seau apres le placement des 
20 elements fonctionnels. En effet sur la figure 5A les 
deux elements fonctionnels Pij et P ij+ i sont voisins 
logiques et Pij se situe avant Pij+i . Sur la figure 5B 
1' element fonctionnel Pij se trouve place apres 
1' element fonctionnel P ij+ i contrairement a son ordre 
25 logique, la fleche 3 6 illustrant l'ordre de placement, 
les endroits marques d'une croix indiquant des places 
occupees par des elements fonctionnels fautifs. 

Cet algorithme de placement est certain 
d'aboutir a une solution du moment que le nombre 
30 d' elements fautifs est inferieur ou egal au nombre 
d' elements fonctionnels supplementaires . 

Deux types d' algorithmes de placement peuvent 
etre induits du procede de 1' invention. 
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Le premier type d'algorithme consiste en une 
utilisation directe du proced6 de 1' invention et est 
illustr6 par la figure 6 avec une structure de 4x4 
elements f onctionnels elementaires et 4 elements 
5 f onctionnels supplementaires . 

La figure 6A illustre le reseau logique, les 
voisins logigues d'un element fonctionnel 6tant aux 
quatre points cardinaux de celui-ci. La figure 6B 
illustre 1 ' ordre de placement des elements f onctionnels 
10 et la figure 6C illustre les places possibles de ces 
elements f onctionnels , les places a une distance de 1 
de la place logique de 1' element fonctionnel 6tant 
essayees avant les places a une distance de 2, etc. 

Sur cette figure 6C on utilise les 
15 representations suivantes : 

c — > : place logique de 1' element fonctionnel 
X : place nouvelle de 1' Element fonctionnel 
l l : place possible de l'616ment fonctionnel 

2 0 L' ordre de placement est defini ainsi : 

1' element fonctionnel d'origine est 1' element 
fonctionnel en haut a gauche Po,o- Les elements 
fonctionnels suivants sont les Elements fonctionnels a 
droite P 0> i et en bas P a , 0 de 1' element fonctionnel 
25 d'origine Po,o* et ainsi de suite en respectant la 
diagonale Pi, 0 ; P0.2 ; Pi,i--- (voir figure 6B) . Cette 
solution, qui est une des solutions possibles pour le 
choix de 1' ordre de placement, a 1 ' avantage de 
permettre de bien respecter le critere 1 dans la suite, 

3 0 et done de fournir un placement qui permet un bon 

routage . A partir de cet ordre de placement, les places 
de chaque element fonctionnel sont choisies parmi les 
cinq places definies sur la figure 6C, leur ordre de 
selection respectant le critere 1. On note que, pour 
3 5 chaque element fonctionnel, le critere 2 est respecte. 
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Le deuxieme type d'algorithme de placement est 
une application du 'proc^de de 1 ' invention en decoupant 
le reseau en blocs d' elements f onctionnels . Apres avoir 
d£fini un ordre de placement des blocs, en partant d'un 
5 bloc d'origine on parcourt tous les blocs, de bloc 
voisin en bloc voisin. Si un tel algorithme est 
appliqu^ a chaque bloc en tenant compte d'une regie de 
placement telle que les places possibles pour, les 
elements f onctionnels d'un bloc ne comportent pas de 

10 place logique des elements fonctionnels des blocs 
places prec^demment, le placement est sur. La figure 7 
illustre ce deuxieme type d'algorithme en considerant 
un bloc forme d'une ligne de quatre elements 
fonctionnels. Les lignes d' elements fonctionnels sont 

15 alors placees en partant de la ligne du haut pour aller 
a la ligne du bas. Pour chaque ligne on utilise des 
places de cette ligne, a laquelle appartiennent les 
Elements fonctionnels logiques, et de la ligne 
immediatement inferieure, ce qui permet de respecter la 

20 regie ci-dessus. Pour chaque ligne, 1' ordre de 
placement est d^fini par 1' Element fonctionnel 
d'origine situe a 1 ' extreme gauche et puis par les 
elements fonctionnels suivants a droite. Les cinq 
places possibles sont alors definies comme le montre la 

25 figure 7. Le meme algorithme de placement est utilise 
pour chaque ligne. La. verification de coherence, 
inutile dans 1 ' exemple consid6r£, ne doit alors 
s'effectuer que sur . les lignes. L'avantage de cette 
variante du procede de 1' invention reside dans la 

30 rapidite de 1' algorithme (moins de retour en arriere, 
verification de coherence plus courte) associee a un 
bon placement lorsque les blocs sont bien dimensionnes 
par rapport aux elements supplementaires , ce qui est le 
cas de 1' exemple considere. 
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La figure 8A illustre un exemple de 
configuration du re'seau dans une topologie de matrice, 
sans element fonctionnel fautif, pour des connexions 
ouest-est et nord-sud. La figure 8B illustre un exemple 
5 de reconfiguration du reseau dans le cas d'un element 
fonctionnel fautif, repr^sente avec des hachures . 

On remargue que le passage par les Elements de 
commutation est obligatoire meme en 1' absence 
d' elements fautifs, ce qui donne une certaine coherence 
10 pour 1' ensemble du syst^me. 

• Etape de routage 

Cette etape est effectuee a 1 ' aide 
d' algorithmes de recherche du plus court chemin et de 

15 recherche en profondeur connus de l'homme du metier. 

De fagron a rester coherent avec les objectifs 
fixes en introduction, le nombre d' elements ^ 
d' interconnexion entre elements fonctionnels voisins 
logiques est limite a un petit nombre, typiquement 3 ou 

20 4 . Le nombre de chemins possibles pour aller d'un 
element fonctionnel a un Element fonctionnel voisin est 
connu et assez faible, moins d'une dizaine en moyenne . 
On suppose que tous ces chemins sont connus mais ils 
peuvent egalement etre calcules par un algorithme de 

25 recherche du plus court chemin. Un exerrple simple de 
1' algorithme de routage en recherche en profondeur des Elements 
d' interconnexion est donhe ci-dessous : 

Initialiser i etj aO 
3 0 Point 0 : Pour le couple Cj d' elements fonctionnels voisins : 
Point 1 : Si le chemin C/i) existe : 

essayer le routage de Cj avec ce chemin 
Si il y a conflit sur un element d* interconnexion 
incrementer i et retour au Point 1 

3 5 Sinon, 
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Si il existe d'autres couples C d' elements fonctionnels : 
incrementer j et retour au Point 0 

Sinon, 

routage reussi, fin 

Sinon, 

Si il existe un couple C* d l elements fonctionnels dont le routage rend 
le routage de Cj impossible 

Supprimer tous les routages entre C* et Cj 
Incrementer le chemin i de C k et retour au point 0 

Sinon 

Routage impossible 

Ceci n'est gu'un exemple de routage connu de 
.15 l'homme du metier permettant de donner un exemple de 
realisation du proc6d6 de reconfiguration de 
1' invention. 

On va considerer ci-dessous successivement des 
20 exemples de realisation de reseaux auxquels s' applique 
le procede de 1' invention, dans lesguels les elements 
fonctionnels sont des processeurs. 

Exemple d'un reseau de processeurs paralleles 
25 Un reseau de processeurs auquel s' applique 

1 ' invention, comme illustre sur la figure 9, est base 
sur une matrice de processeurs elementaires quelconques 
P a deux entrees et deux sorties, relies entre eux par 
des elements d' interconnexion Cm. Le reseau est compost 
30 d'un ensemble de lignes d' elements interconnexion 20 et 
de lignes de processeurs 21 disposees alternativement . 
Chaque processeur P est entoure de quatre elements 
d' interconnexion Cm. Les elements de bord du reseau 
sont des elements d' interconnexion Cm. Les lignes de 
35 processeurs sont des lignes de processeurs elementaires 



5 
10 

Fin 
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P et la derniere ligne de processeurs est une ligne de 
processeurs elementciires supplementaires Sp . Une telle 
caracteristique permet d'obtenir une plus grande 
souplesse dans le choix du nombre de processeurs 
5 supplementaires contrairement au dispositif de 1 ' art 
antSrieur illustrS sur la figure 1, dans lequel avec 
une ligne et une colonne de processeurs supplementaires 
la proportion de processeurs supplementaires varie en 
fonction du produit du nombre de lignes par le nombre 

10 de colonnes . 

Les elements d' interconnexion Cm permettent de 
realiser les liaisons, par commutation du reseau, entre 
les differehts processeurs P. Un Element Cm de ce type 
est illustre sur la' figure 10, avec ses differentes 

15 entrees et sorties. II possede six entries et six 
sorties monodirectionnelles reliees respectivement aux 
entries des processeurs sud-ouest et nord-est, aux 
sorties des processeurs nord-ouest et sud-est, et aux 
quatre entrees et quatre sorties des elements 

20 d' interconnexion situes au nord, a l'est, au sud et a 
l'ouest. Un element ainsi represents correspond a un 
element du centre du reseau. 



Elements d' interconnexion des bords du reseau possedent 



Comme illustre sur les figures 11A a 11H, les 



25 



moins d' entries et/ou 
emplacement. 

On a ainsi : 



moins de sorties selon leur 



35 



30 



- Cm nord-ouest 



- Cm nord 



- Cm nord-est 



- Cm sud 



- Cm ouest 



- Cm sud-ouest 



- Cm est 



- Cm sud-est 



figure 11A 
figure 11B 
figure 11C 
figure 11D 
figure HE 
figure 11F 
figure 11G 
figure 11H. 
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Chague sortie d'un element d' interconnexion Cm 
peut §tre reliee k n'importe quelle entree. II est 
possible de changer de fagon dynamique la maniere 
(appel^e configuration) de realiser ces liaisons au 
5 moyen, par exemple, de registres . de configuration 
associes a une commande de configuration. 

Comme iilustr£ sur la figure 12, dans ce reseau 
chaque processeur P est reli6 ' a quatre elements 
d' interconnexion Cm, deux de ces elements Cm 
10 diam^tralement opposes etant connectes aux deux entrees 
du processeur et les deux autres Elements Cm, egalement 
diametralement opposes, etant connectes aux deux 

sorties du processeur. Ces elements d ' interconnexion Cm 
sont de plus relies entre eux par des liaisons 
15 horizontales et verticales . 

Chaque communication entre processeurs P se 
.fait par 1 ' interm^diaire d' elements d' interconnexion 
Cm. On obtient ainsi 50 % • de connexions internes 
supplementaires par rapport aux connexions 
20 « f onctionnelles » et des connexions supplementaires 
avec l'ext^rieur reduites aux connexions des 
processeurs supplementaires Sp. 

Les communications supportees par le reseau 
sont au minimum celles decrites sur la figure 13 : des 
25 communications sud vers nord et est vers ouest 6tant 
illustr^es sur la figure 13A ; des communications 
melangees etant illustr^es sur la figure 13B ; des 
communications est-ouest etant iliustr^es sur la figure 
13C ; Chaque communication illustr^e sur ces figures 
30 ayant une communication « duale » . 

D' autres communications peuvent bien entendu 
etre envisagees . 

Dans le procede de tolerance aux fautes de ce 
reseau, les processeurs supplementaires Sp de la 
35 derniere ligne sont utilises pour remplacer des 
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processeurs elementaires P defaillants dans les autres 
lignes. 

Exemple d'un mode de realisation d'un tel reseau de 
5 processeurs 

Dans ce mode de realisation le reseau de 
processeurs est constitue d'une matrice de neuf 
processeurs et de seize Elements d' interconnexion. 
Chaque processeur P est un simple Element de calcul 

10 integrant une unite logigue et arithmetique, un 
ensemble de registres de travail et une logique de test 
permettant d'effectuer le test automatique du 
processeur (test dit « integre ») . Lors de 1 ' execution 
d'un programme de test, cette logique £met un signal de 

15 test d'integrite t_i indiquant si le processeur est 
defaillant. Le processeur P n'est pas d6crit ici car il 
est bien connu de l'homme de metier. 

Un element d' interconnexion est du type de 
celui illustre sur la figure 10, les Elements d'inter- 

2 0 connexion des figures 11A a 11H n'etant que des derives 

simplifies de celui-ci. Cet element d' interconnexion, 
. illustre sur la figure 14A, est compost de six 
multiplexeurs de donnees de six entrees vers une 
sortie. Chacun de ces multiplexeurs est command^ par 
25 trois fils de selection de la voie de sortie afin de 
permettre de relier chacune des sorties de l'61£ment 
d' interconnexion a n'importe quelle entree. La largeur 
du champ de donnee de chacune des voies est ici de 4 
bits. Les selections des six multiplexeurs sont 

3 0 memorisees dans deux registres 40 de 18 bits chacun .(3 

bits de selection pour chaque multiplexeur ) a 
l'interieur de 1' element d' interconnexion . Ces 
registres 4 0 on.t une double f onctionnalite puisqu'ils 
peuvent fonctionner en registres normaux et en 
3 5 registres a decalage lors du chargement. Ces deux 
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registres de configuration 40 permettent a deux 
configurations differentes du reseau de cohabiter 
dynamiquement . 

La figure 14B illustre le detail du contrdle 
5 d'un multiplexeur , la zone 41 etant la zone de commande 
de ce multiplexeur dans un des registres 40. 

Le chargement des deux registres de 
reconfiguration 40 s'effectue en serie grace aux 
signaux nw_sw et confsw.in'. Le signal nw_sw (« not- 

10 write switch ») autorise l'ecriture du signal de 
configuration confsw_in (« configuration switch 
input ») dans la premiere bascule d'un registre 40 
lorsqu'il est a 1 ' etat bas et interdit cette ecriture a 
l'etat haut. Le chargement des configurations est 

15 synchrone et ob6it done a l'horloge globale du systeme 
elk. Lorsque l'ecriture de confsw_in est autorisee dans 
la premiere bascule d'un des registres 40, le contenu 
de cette bascule est charg6 dans la deuxieme bascule et 
ainsi de suite jusqu'a la derniere bascule, dont le 

20 contenu constitue le signal confsw_in de 1 ' element 
d' interconnexion suivant. Le signal sel_swl2 
(« selection switch configuration 1/2 ») permet de 
selectionner , lors du chargement, le registre ou 
charger les configurations et egalement de selectionner 

25 la configuration des elements d ' interconnexion de 
maniere dynamique, e'est-a-dire de faire varier . la 
configuration des elements d' interconnexion lors du 
deroulement d'un programme, a chaque coup d'horloge. Un 
Element d' interconnexion est ainsi compose de 24 bits 

30 de donnees en entree, de 24 bits de donnees en sortie, 
de deux signaux de chargement de configuration et d'un 
signal de changement dynamique de configuration (en 
cours de f onctionnement normal) entre les 
configurations chargees dans les registres. internes des 

3 5 elements d' interconnexion . 
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Les processeurs P et les Elements 
d' interconnexion Cm' sont connectes comme illustre sur 
la figure 15. L' ensemble forme la matrice de 
processeurs qui est commandee par une unite de contrdle 
5 UC . Cette unite de controle UC envoie les instructions 
aux processeurs permettant d'effectuer les operations 
et contrSle les, elements d' interconnexion a 1 ' aide des 
trois signaux confsw__in, nw__sw et sel_swl2 precedemment 
cites. L'unit6 de controle permet ainsi le d^roulement 

10 de programmes normaux ainsi que de programmes de test 
des processeurs. L'unit6 de contrdle effectue de fagon 
periodique le test des processeurs qui retournent a un 
controleur leur 6tat par 1 ' interm^diaire du signal t_i . 
Le diagnostic de la matrice de processeurs est alors 

15 effectue par le contrdleur grfice a 1 ' interpretation des 
signaux t_i de tous les processeurs . Le controleur peut 
effectuer le calcul des nouvelles configurations des 
elements d ' interconnexion correspondant a l'etat de la 
matrice de processeurs. II informe alors 1' unite de 

20 controle de ces nouvelles configurations. L' unite de 
controle envoie alors les informations permettant de 
configurer les differents Elements d' interconnexion, 
puis envoie les corrumandes d' execution des programmes de 
calculs sur les processeurs actifs. 

25 La matrice de processeurs ainsi que les 

elements d' interconnexion peuvent itre integres dans un 
circuit integre specifique (ASIC). L'unite de controle 
peut etre integree dans des composants de logique 
reconf igurable (FPGA pour « Field Programmable Gate 

3 0 Array ») , ceci pour une plus grande souplesse 
d' utilisation. Le controleur peut §tre realise a 1 ' aide 
d'un ordinateur, d'un composant FPGA ou meme d'un 
module dedie. 

Dans la description precedente, on a envisage 

3 5 une commande dynamique separee de- chacun des elements 
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d' interconnexion par 1' unite de controle ; on pourrait, 
sans sortir du cadre de 1' invention, effectuer ladite 
commande de fagon statique, sans passer par 1' unite de 
controle, par exemple par le biais d'un processeur 
5 exterieur au systeme. 

Exemple d'un reseau d'hypercubes 

Un grand nombre d' architectures qui possedent 
la regie de regularite, ou que 1 ' on peut ramener a une 
10 • structure reguliere telle que d^finie prec6demment 
peuvent beneficier du precede de placement de 
1 ' invention. 

Un exemple de reseau regulier est l'hypercube a 
n dimensions. Dans ce " reseau de processeurs, chaque 

15 processeur est relie directement a n autres processeurs 
■en respectant une regie sur la num^rotation binaire des 
processeurs (chaque processeur . est reli6 aux 
processeurs dont le mot binaire est adjacent, i.e. dont 
le num6ro binaire ne differe que d'un seul bit). Un 

20 exemple d'hypercube de dimension 3 et comprenaht done 
16 processeurs est donne sur la figure 16. 

Cette structure, qui est reguliere lorsqu'elle 
est representee dans l'espace, perd sa regularite sur 
le papier par un effet de perspective. Mais elle perd 

25 egalement sa regularity lorsqu'elle est realisee sur 
une carte electronique qui n'accepte que des composants 
sur sa surface. Afin de prendre en compte ce point, le 
reseau presente sur la figure 17 montre les liens 
reels, les liens virtuels/qui permettent de rendre la 

30 structure reguliere en deux dimensions, et les 
processeurs supplementaires S p avec les liens 
(virtuels) les reliant a la structure principale. 

On se ramene ainsi a une structure 2-D 
reguliere comprenant quatre processeurs 

35 supplementaires. La notion.de distance qui d^finit la 
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mesure pour le placement « au plus pres » des 
processeurs est une distance calculee par rapport a 
cette structure. Dans ces conditions, les algorithmes 
de placement sont les memes que ceux utilises pour le 
5 maillage 2-D, la realisation physique du reseau primant 
sur sa fonction logique. 

La figure 18 montre alors un exemple de 
reconfiguration obtenue avec trois processeurs fautifs. 
les liens en traits pleins sont les liens physiques 
10 qu'il faut r^aliser de fagon a conserver la structure 
d ' hypercube . 

Enfin, la figure 19 montre une extension du 
principe de liens virtuels pour un reseau hypercube de 
dimension 4 comprenant une • ligne de processeurs 
15 supplementaires . . L' algorithme de placement utilise est 
alors le meme que celui utilise pour la structure 
maillage 2-D comprenant 8 lignes x 4 colonnes et une 
ligne de processeurs supplementaires. 

Le procede de reconfiguration ne restreint pas 

2 0 le choix de la structure tolerante aux fautes sur 

laquelle peut etre r^alisee une telle structure, qui 
peut done etre tout a fait arbitraire. 

Le procede de 1 ' invention peut €tre 6galement 
utilise en. vue d'obtenir une structure tolerante aux 
25 fautes, dans des architectures des systemes 
electroniques num^riques utilisant un grand nombre 
d' elements fonctionnels identiques interconnects en 
ligne, en matrice ou en • hypercube . La seule contrainte 
est d' assurer que chaque element fonctionnel soit 

3 0 testable soit de maniere locale, soit de maniere 

globale afin que 1' algorithme de placement/routage 
puisse avoir la connaissance des Elements fonctionnels 
defaillants. 

II est difficile d' identifier toutes les 
35 architectures electroniques capables de tirer profit de 
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1' invention. On peut toutefois presenter guelques 
exemples . 

• Correlateur ID ou 2D 

5 II s'agit' de 1 ' association en ligne ou en 

matrice d'£16ments fonctionnels dont le r61e est 
d'effectuer une multiplication des entrees suivie d'une 
addition du rSsultat de cette multiplication avec le 
rSsultat prScSdent. On parle alors de Multiplieur 

10 Accumulateur (MAc), comme illustre sur la figure 20. 
Les donnees « entree ligne » sont correlees avec les 
« entree colonne » grace a des cellules Multiplieur 
Accumulateur (MAc) . organisees en tableau, toutes 
identiques . II est alors facile de mettre en oeuvre le 

15 procede de 1' invention, comme illustre sur la figure 
21. La derniere ligne de la matrice constitue la ligne 
de « MAc spare » . 

• Architecture de matrice de blocs de calculs de la 

2 0 trans formee de Fourier rapide (FFT) 

Cette architecture est egalement organisee 
autour d'un assemblage en matrice d' Elements 
fonctionnels de type MAc avec un schema 
d' interconnexion plus complexe, en multi-stages 
25 (papillon FFT) mais tou jours avec deux entrees et deux 
sorties par MAc. L'ajout d'une ligne supplementaire 
d' Elements fonctionnels ainsi que des elements de 
commutation permet de tolerer des defaillances sur la 
structure logique complete. 

3 0 Ces deux derniers exemples montrent que le 

procede de 1' invention est utilisable sur des 
architectures electroniques numeriques interconnectant 
un ensemble d' elements fonctionnels identiques, autres 
que des processeurs. Les structures tres regulieres des 
3 5 composants FPGA (« Field Programmable Gate Array » 
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interconnectant en matrice egalement des blocs de 
logigue reconf igurable (a base de memoire RAM par 
exemple) peuvent egalement tirer parti du procede de 
1 ' invention . 

5 Enfin, le domaine des telecommunications doit 

egalement tirer profit du procede de 1' invention. En 
effet, dans les; routeurs de messages par exemple, des 
elements fonctionnels identigues sont interconnectes 
pour . former le systeme complet . 
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REVENDICATIONS 

1. Procede de reconfiguration d'un reseau 
d' Elements fonctionnels identigues paralleles avec 

5 tolerance aux fautes de ces elements fonctionnels, le 
reseau comportant lesdits 616ments fonctionnels de base 
(P) , des Elements fonctionnels supplementaires (Sp) , 
des 616ments d ' interconnexion (Cm) de ces Elements 
fonctionnels et une unit6 de contr61e, ledit procede 
10 etant caracteris6 en ce gu'il comprend : 

- une etape de placement des elements 
fonctionnels du reseau logique ; 

- une etape de routage consistant en une 
programmation des elements d' interconnexion sur le 

15 reseau physique, en choisissant un nombre maximal 
d'61ements d' interconnexion pouvant etre traverses 
entre deux elements fonctionnels voisins utilisant un 
algorithme de recherche du plus court chemin. 

2. Proced6 selon la revendication 1, dans 

20 lequel : 

- on determine un ordre de placement des 
elements fonctionnels du reseau qui est constitue d'un 
element fonctionnel d'origine et d'une suite d' elements 
fonctionnels englobant tous les Elements fonctionnels ; 

25 - pour chacun des elements fonctionnels on 

essaie de le placer en commengant par sa place logique 
puis, si n^cessaire en cas d'echec, en chacune des 
places situ^es a une distance 1, a une distance 2... de 
la place logique de cet Element fonctionnel, avec comme 

30 restriction qu'une et une seule place supplementaire 
doit etre utilisee par rapport aux places possibles des 
elements fonctionnels precedemment places, en arretant 
lorsque S+l places ont 6te essayees , S etant le nombre 
d' elements fonctionnels supplementaires ; 
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- si S+l places ont ete essay^s sans 
succes, on revienf a 1' element fonctionnel precedent 
dans l'ordre de placement et on passe a la place 
suivante pour cet 6l6ment fonctionnel. 
5 3. Proc^de selon la revendication 2, dans 

lequel, lorsque tous les elements fonctionnels sont 
places, on verifie pour chague dimension du reseau que 
l'ordre logique est respect^ pour chaque couple 
d' elements fonctionnels, si ce n'est pas le cas on 
10 inverse les places de ces elements fonctionnels. 

4. Proc6d6 selon la revendication 1, dans 
lequel l'ordre de placement est d^fini ainsi : 
1' element fonctionnel d'origine est l'616ment 
fonctionnel en haut a gauche, les elements fonctionnels 

15 suivants sont les Elements fonctionnels a droite et en 
bas de l'61ement fonctionnel d'origine, et ainsi de 
suite en respectant une diagonale. 

5. Proc6d6 selon la revendication 1, dans 
lequel on decoupe le reseau en blocs de 1' Element 

20 fonctionnel et on definit un ordre de placement des 
blocs en partant d'un bloc d'origine et en parcourant 
tous les blocs de bloc voisin en bloc voisin, les 
places possibles pour les elements fonctionnels d'un 
bloc ne comportant pas de place logique des elements 

25 fonctionnels des blocs places pr6c6demment . 

6. Procede selon la revendication 1, dans 
lequel les 616ments fonctionnels sont des processeurs. 
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